MCA数据库

您所在的位置:网站首页 单细胞测序 内耳细胞 MCA数据库

MCA数据库

2023-05-29 17:51| 来源: 网络整理| 查看: 265

原标题:MCA数据库——轻松解决小鼠细胞图谱研究中的种种问题

细胞是生命的基本单位,长期以来,许多研究人员致力于细胞的分类与鉴定。最初对细胞进行分类鉴定主要基于细胞的位置、形态以及细胞的组分,随后免疫组织化学、荧光激活细胞分类(FACS)、荧光原为杂交(FISH)等方法也应用在细胞的分类上[1]。现在,单细胞转录组测序技术展现了极强的细胞分类与鉴定能力,可以进一步完善现有的分类系统。

单细胞转录组数据复杂,通过人为查阅、总结的方式难以得到完整的准确规律,所以在分析过程中常常会使用降维、聚类以及可视化的策略,形成一张细胞数据的聚类图。然而这种聚类是没有生物学意义的,我们必须为聚类赋予生物学意义,定义细胞类型和状态以支持生物学的探索,也就是需要进行细胞注释。

细胞注释是单细胞转录组研究的重要部分,也是进一步深入数据挖掘的基础。目前,细胞注释分为3个步骤,包括:自动注释、手动注释以及验证 [2]。自动注释使用一组在已知细胞类型中特定表达的“marker基因”或者使用现有的经过注释的单细胞数据,将需要研究的单个细胞或者细胞簇的基因表达模式与已知的细胞类型的基因表达模式进行比对进而识别与鉴定目标细胞或细胞簇。手动注释即根据每个细胞簇的基因和基因功能,验证自动注释的结果并识别新的细胞类型和状态。验证可以使用实验方法来确认目标细胞的类型与功能。其中,自动注释作为细胞注释的第一步,通过算法将研究数据与现有的数据库进行比对,能够有效的鉴定细胞类型,从而节省了手动注释的成本。自动注释可以快速识别已知的主要细胞类型,并突出显示未知的细胞簇以供进一步研究,但这一过程存在一个难点,即仍然有许多细胞类型缺少清晰的基因表达模式,导致了细胞注释的不准确;手动注释也往往因为可用于细胞注释的标记基因不完善对部分细胞亚群难以形成定义。随着单细胞转录组研究的迅速发展,现已形成了一个共识,即建立一个全面的单细胞数据库。

目前,研究人员已经开发出了大量的单细胞转录组细胞注释数据建库,如:CellMarker、Human Cell Atlas、PanglaoDB等。但如何有效使用这些数据库是研究人员需要面对的主要难点。本文就以小鼠研究为例,分享MCA数据库(Mouse Cell Atlas)如何在小鼠细胞注释中发挥作用。

MCA数据库介绍及应用

MCA数据库在2018年发表于 Cell 期刊 [3],是基于Microwell-seq高通量单细胞测序平台对小鼠多个器官进行了系统性的单细胞转录组分析所构成的小鼠单细胞数据库。数据库的主要功能分为三个部分:浏览、搜索和注释。截至2023年2月该数据库收录了小鼠29种器官及组织,>1,210,000个细胞数据。

通过https://bis.zju.edu.cn/MCA/index.html进入数据库主页,主页的About MCA介绍了数据库的概况,Mouse tissue info记录了每个组织的信息,Microwell-seq Protocol可以查看建库操作。

数据库主页

浏览部分

浏览部分为包括了Atlas和Gallery两大板块。

Atlas将小鼠所有组织的单细胞转录组数据整合并降维、聚类绘制成细胞图谱,更有利于对小鼠整体的细胞类型分布和基因表达分布进行查看。这种全局性图谱其实并不适合查看细胞类型,而应更多关注基因分布情况。对一个细胞类型,其标记基因在不同组织类型之间是存在差异的,例如内皮细胞会在心脏特异性表达 Aqp7 基因而在肺中特异性表达 Tmem100 基因,在不确定到底哪一个基因更适合用于自己样本的细胞类型鉴定时,不妨可以在这张图谱中查看一下对应基因的表达分布模式。而至于对细胞类型的研究,则更应放在对应的组织中进行查看,也即是Gallery板块。

展开全文

Atlas部分的目标组织搜索

Gallery则是着重于具体组织的单细胞数据收录,其涵盖了对应组织中全面的细胞信息,可根据研究的课题对小鼠具体组织的细胞类型进行选择。数据库收录了全面的组织和器官数据,其中包括了不同发育阶段的数据,可用于研究目标基因在时间、空间尺度上的表达变化。与上述相似,基因不仅在不同的组织中存在差异,其表达量在个体的发育中也呈现不同的表达模式,例如: Sox2 参与了干细胞和神经发生的调控,在小鼠胚胎发育过程中,其表达量逐渐降低,而在神经元发生过程中上调;不同的 Hox 基因会在发育的不同时间点上调或下调表达量等。当对目标基因的表达位置、在发育过程中的表达情况等感兴趣时,可以参考Gallery板块中的对应信息。

Gallery部分的结果展示

搜索部分

Search由检索组织和检索图谱构成,提供了在目标组织或者是全数据库中搜索目标基因的功能,可以快速的查看所选样本中目标基因表达统计结果,也可以查看目标基因的表达量前20细胞类型、所在组织和发育阶段信息。这就很好的起到了对浏览部分提供使用辅助的作用,当使用Atlas的全数据集查看时,就可以结合使用检索图谱的方法;使用Gallery时,可以结合针对目标组织的检索组织。除此之外,Search功能在手动注释的过程中也有强大的作用,使用检索图谱功能可以快速的完成注释结果的检验,也就是对下文的run-scMCA板块结果进行验证,以更好的解释生物学问题。

检索图谱功能展示

注 释 部 分

MCA数据库的还提供了网页版的自动注释工具,即run-scMCA板块。可以上传DGE矩阵并使用数据库信息进行细胞类型鉴定。细胞注释是给数据赋予生物学意义的重要步骤,是进行后续分析与结果解读的基础。如:新细胞类型的发现、细胞发育轨迹的确定、细胞功能和代谢的研究、细胞在疾病中的作用等都需要建立在准确的细胞图谱上。在数据降维、聚类进行进一步鉴定时,可以考虑使用MCA数据库。除了使用方便之外,数据库本身包含了较为全面的小鼠组织数据,得到的细胞鉴定结果可能更能说明问题。

细胞注释结果

总的来说,MCA数据库较为全面,可以进行交互性的结果展示及个性化内容搜索,也提供了数据比对的功能,可以称得上是功能全面,使用方便的数据库。

参考文献

[1] Regev A, Teichmann S A, Lander E S, et al. The human cell atlas[J]. elife, 2017, 6: e27041.

[2] Clarke ZA, Andrews TS, Atif J, et al. Tutorial: guidelines for annotating single-cell tranomic maps using automated and manual methods. Nat Protoc. 2021;16(6):2749-2764. doi:10.1038/s41596-021-00534-0

[3] Han, X. et al. Mapping the Mouse Cell Atlas by Microwell-Seq. Cell, 2018. DOI: 10.1016/j.cell.2018.02.001.

*未经许可,不得以任何方式复制或抄袭本篇文章之部分或全部内容。版权所有,侵权必究。

基迪奥生物|专业定制测序服务

联系方式:020-39341079;[email protected]返回搜狐,查看更多

责任编辑:



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3